专利摘要:
EineDokumenteninformations-Verarbeitungsvorrichtung enthält eineFormelementen-Analysevorrichtung (12) zum Durchführen einer Formelementenanalysebei einem Klartextdokument, das von einer Klartextdokumenten-Eingabeeinheit(10) eingegeben wurde, durch Verwendung eines in einer Wörterbuch-Speichereinheitgespeicherten Wörterbuchs,um das Klartextdokument in Kontrollinformationen zu zerlegen, eineSyntax-Analysevorrichtung (13) zum Analysieren des Teils von Sprachevon jeder der von der Formelementen-Analysevorrichtung erhaltenenKontrollinformationen, um ein strukturiertes Dokument, das bedeutungsvolleWörterenthält, zuerzeugen, eine Elementenveredelungs-Verarbeitungseinheit (15) zumDurchführeneines Erhöhungsvorgangs zumHinzufügenvon mit jedem der bedeutungsvollen Wörter, die in dem von der Syntax-Analysevorrichtungerzeugten und in einer Datenspeichereinheit (14) gespeicherten strukturiertenDokument enthalten sind, assoziiert sind, zu jedem der bedeutungsvollenWörter,um ein Erhöhungsdokumentzu erzeugen, und eine Erhöhungsdokument-Ausgabeeinheit(17) zum Ausgeben des von der Elementenveredelungs-Verarbeitungseinheiterzeugten Erhöhungsdokuments.
公开号:DE102004018446A1
申请号:DE102004018446
申请日:2004-04-08
公开日:2004-12-23
发明作者:Tatsuya Mitsugi
申请人:Mitsubishi Electric Corp;
IPC主号:G06F17-21
专利说明:
[0001] Dievorliegende Erfindung bezieht sich auf eine Dokumenteninformations-Verarbeitungsvorrichtung, undinsbesondere auf eine Technologie zum, wenn jedes Wort oder jedeKopula, das/die in einem Dokument enthalten ist, eine Bedeutunghat, Hinzufügenvon Informationen, die die Bedeutung oder den Inhalt von jedem Wortoder jeder Kopula zu jedem Wort oder jeder Kopula anzeigen.
[0002] Herkömmlicherweiseist als eine Technologie zum automatischen Klassifizieren individuellerWörter, diegegenwärtigin Textdaten verwendet werden durch statistische Verarbeitung derindividuellen Wörtereine Technologie zum Hinzfügeneiner Kontrollinformation zu jeder Folge von Wortklassen mit einerWahrscheinlichkeit des Auftretens in den Textdaten, die gleich einemoder höherals ein vorbestimmter Wert ist, Teilen jedes von Sätzen, indenen Wörterund Kontrollin formationen zusammen existieren, wobei die Sätze in einerFolge von Wörternund Kontrollinformationen der Textdaten enthalten sind, so dassdie Wahrscheinlichkeit der Erzeugung von Folgen von Wörtern undKontrollinformationen der Textdaten maximiert ist, Ersetzen jederKontrollinformation durch eine Kopula, die in den Textdaten existiert,und automatisches Klassifizieren zusammen von Wörtern und Kopulas, bekannt(siehe z.B. die Veröffentlichungder Japanischen Patentanmeldung (TOKKAIHEI) Nr. 10-97286).
[0003] Für ein System,das eine riesiges Volumen von Dokumentinformationen zusammenfasst,sie in Ausdrückeumwandelt, die leicht durch Sprache zu fangen sind, in einer gesprochenenSprache geschriebene Dokumente in geschriebene Wörter, die leicht zu lesen sind,umwandelt, und wichtige Komponenten (d.h., charakteristische Ausdrücke) herauszieht,wie die Namen von Personen und Plätzen, die Namen von Organisationen,Datumsangaben usw. von Zeitungsartikeln usw., ist eine Technik bekannt,die es ermöglicht,deklaratorisch und einfach eine Widerschreibregel enthaltend Beschränkungen über Zeichenkettenund eine Regel, die das Herausziehen von charakteristischen Ausdrücken ohneBetrachtung der Reihenfolge von Prozessen beherrscht (siehe z.B.die Veröffentlichungder Japanischen Patentanmeldung (TOKKAI) Nr. 2001-67355). Gemäß dieserTechnologie wird ein Satz von Wiederschreibregeln, die von Benutzernbeschrieben werden, durch eine Übersetzungsvorrichtungin einen Satz von Regeln umgewandelt, die eine Grammatik von definierten Klauselnbeherrschen, und der Satz von Regeln, die die Grammatik von definiertenKlauseln beherrscht wird dann durch eine Regelintegrationsvorrichtungin eine integrierte Regel umgewandelt, der parallel und mit hoherGeschwindigkeit verarbeitet werden kann. Eine Wiederschreib-Ausführungsvorrichtungnimmt dann die integrierte Regel und ein Dokument (d.h., ein Originaldokument,das geändertwerden sollte, an und gibt das geänderte Ergebnis aus.
[0004] Diedurch die Veröffentlichungder Japanischen Patentanmeldung (TOKKAIHEI) Nr. 10-97286 und die Veröffentlichungder Japanischen Patentanmeldung (TOKKAI) Nr. 2001-67355 offenbartenTechnologien nach dem Stand der Technik klassifizieren jedoch automatischWörterund Kopulas, die in einem Dokument enthalten sind, am besten, abersie könnenselbst die Bedeutung oder den Inhalt, welche jedes Wort oder jedeKopula, das/die in dem Dokument enthalten ist, hat, ausdrücken.
[0005] Dasich Kommunikationstechnologien und Informationssteuertechnologienin den letzten Jahren entwickelt haben, führen verschiede Typen von Informationsausrüstungs-Endgeräten häufig einenAustausch von alphabetischen Informationen durch, der dargestelltist durch einen Austausch einer E-Mail und Durchsehen von Homepagesan verschiedenen Stellen und zu verschiedenen Zeiten. Die Interpretationvon jedem Wort oder jeder Kopula, das/die in den alphabetischenInformationen enthalten ist, wird jedoch durchgeführt aufder Grundlage des menschlichen Gedächtnisses und der menschlichenBeurteilung. Daher gibt es einige Fälle, bei denen aufgrund einesFehlers der Beurteilung des Kontextes oder der Syntax der alphabetischenInformationen und eines Fehlers des Speichers der Lieferant deralphabetischen Informationen und der Empfänger der alphabetischen Informationendie Bedeutung und den Inhalt der alphabetischen Informationen unterschiedlichverstehen, so dass der Lieferant seine Meinung gegenüber demEmpfängerdurch Verwendung der alphabetischen Informationen nicht fehlerfreiausdrückenkann.
[0006] Dievorliegende Erfindung wurde gemacht, um die obigen Probleme zu lösen, undes ist daher eine Aufgabe der vorliegenden Erfindung, eine Dokumenteninformations-Verarbeitungsvorrichtungzu schaffen, die Benutzer überdie Bedeutung und den Inhalt eines Zieldokuments sicher informierenkann.
[0007] Gemäß der vorliegendenErfindung ist eine Dokumenteninformations-Verarbeitungsvorrichtungvorgesehen, welche enthält:eine Klartextdokumenten-Eingabeeinheitzum Eingeben eines Klartextdokuments; eine Wörterbuch-Speichereinheit zumSpeichern eines Wörterbuchs,das zur Formelementanalyse und zur syntaktischen Analyse verwendetwird; eine Formelementen-Analysevorrichtung zum Durchführen einerFormelementenanalyse bei dem von der Klartextdokumenten-Eingabeeinheit eingegebenenKlartextdokument durch Verwendung des in der Wörterbuch-Speichereinheit gespeichertenWörterbuchs,um das Klartextdokument in Kontrollinformationen zu zersetzen; eineSyntax-Analysevorrichtungzum Analysieren eines Teils von Sprache von jeder der jeweiligenKontrollinformationen, die durch die Formelementen-Analysevorrichtungerhalten wurden auf der Grundlage einer Syntax des Klartextdokuments,um ein strukturiertes Dokument zu erzeugen, das bedeutsame Wörter enthält; eineDatenspeichereinheit zum Speichern von Daten, die für einenErhöhungsprozessverwendet werden; eine Elementveredelungs-Verarbeitungseinheit zumDurchführendes Erhöhungsprozessesdes Lesens und Hinzufügensvon Daten, die mit jedem der bedeutsamen Wörter verbunden sind, die indem strukturierten Dokument enthalten sind, das von der Syntax-Analysevorrichtungerzeugt wurde, und die in der Datenspeichereinheit gespeichert sind,zu jedem der bedeutsamen Wörter,um ein erhöhtesDokument zu erzeugen; und eine Ausgabeeinheit für erhöhte Dokumente zur Ausgabe dervon der Elementveredelungs-Verarbeitungseinheit erzeugten erhöhten Dokumente.
[0008] Wievorstehend beschrieben ist, ersetzt gemäß der vorliegenden Erfindungdie Dokumenteninformations-Verarbeitungsvorrichtungein Stückvon alphabetischen Informationen oder ein Dokument in Wörter und kannjedes dieser Wörterentsprechend seinem Teil von Sprache klassifizieren. Dann kann dieDokumenteninformations-Verarbeitungsvorrichtung automatisch dieBedeutung oder den Inhalt jedes bedeutsamen Worts, das in dem Zieldokumententhalten ist, durch Vorsehen einer Erhöhung für die Bedeutungs- oder Inhaltsanfügung zudem klassifizierten Wort auf der Grundlage der Struktur des Zieldokumentsund der darin gespeicherten Daten hinzufügen. Daher kann die Dokumenteninformations-Verarbeitungsvorrichtungein leicht verständlichesDokument zu dem Empfänger übertragen,das den Empfänger über seineBedeutung informieren kann und in welchem die Mehrdeutigkeit jedesWortes oder jeder Kopula eliminiert ist.
[0009] DieErfindung wird im Folgenden anhand von in den Figuren dargestelltenAusführungsbeispielennäher erläutert. Eszeigen:
[0010] 1 ein Blockschaltbild, dasdie Struktur einer Dokumenteninformations-Verarbeitungsvorrichtung gemäß dem Ausführungsbeispiel1 der vorliegenden Erfindung darstellt,
[0011] 2 ein Blockschaltbild, dasdie Struktur einer Dokumenteninformations-Verarbeitungsvorrichtung gemäß einerVariante des Ausführungsbeispiels1 der vorliegenden Erfindung darstellt,
[0012] 3 ein Blockschaltbild, dasdie Struktur einer Dokumenteninformations-Verarbeitungsvorrichtung gemäß eineranderen Variante des Ausführungsbeispiels1 der vorliegenden Erfindung darstellt,
[0013] 4 ein Blockschaltbild, dasdie Struktur einer Dokumenteninformations-Verarbeitungsvorrichtung gemäß einerweiteren Variante des Ausführungsbeispiels1 der vorliegenden Erfindung darstellt,
[0014] 5 ein Blockschaltbild, dasdie Struktur einer Dokumenteninformations-Verarbeitungsvorrichtung gemäß noch einerweiteren Variante des Ausführungsbeispiels1 der vorliegenden Erfindung darstellt,
[0015] 6 ein Blockschaltbild, dasdie Struktur einer Elementveredelungs-Verarbeitungseinheit der in 1 gezeigten Dokumenteninformations-Verarbeitungsvorrichtungdarstellt,
[0016] 7 ein Flussdiagramm, dasdie von der Elementveredelungs-Verarbeitungseinheit nach 6 durchgeführte Verarbeitungdarstellt,
[0017] 8 ein Flussdiagramm, dasvon der in 6 gezeigtenElementbeziehung-Analysevorrichtung durchgeführte Verarbeitung darstellt,
[0018] 9 ein Flussdiagramm, dasdie von einer in 6 gezeigtenVerarbeitungseinheit fürgeeignete Namenselemente durchgeführte Verarbeitung darstellt,
[0019] 10 ein Flussdiagramm, dasdie von einer in 6 gezeigtenPositionselement-VerarbeitungseinheitdurchgeführteVerarbeitung darstellt,
[0020] 11 ein Flussdiagramm, dasdie von einer in 6 gezeigtenZeitelement-Verarbeitungseinheit durchgeführte Verarbeitung darstellt,und
[0021] 12 ein Flussdiagramm, dasdie von einer in 6 gezeigtenTätigkeitselement-VerarbeitungseinheitdurchgeführteVerarbeitung darstellt.
[0022] EineDokumenteninformations-Verarbeitungsvorrichtung gemäß der vorliegendenErfindung kann durch Software implementiert sein, die in verschiedenenInformationsprozessoren wie einem Personalcomputer, einem Servercomputerund einem PDA enthalten sein kann.
[0023] 1 ist ein Blockschaltbild,das die Struktur einer Dokumenteninformations-Verarbeitungsvorrichtunggemäß dem Ausführungsbeispiel1 der vorliegenden Erfindung zeigt. Diese Dokumenteninformations-Verarbeitungsvorrichtungenthälteine Eingabeeinheit 1, eine Erhöhungsverarbeitungseinheit 2 undeine Ausgabeeinheit 3.
[0024] DieEingabeeinheit 1 kann aus einer Eingabevorrichtung einesInformationsprozessors bestehen, mit dem die Dokumenteninformations-Verarbeitungsvorrichtunggebaut ist. Diese Eingabeeinheit 1 erzeugt ein Klartextdokumentaus einem Dokument von irgendeinem von verschiedenen Typen und sendetes zu der Erhöhungsverarbeitungseinheit 2.Die Erhöhungsverarbeitungseinheit 2 erzeugtein Erhöhungsdokument(Markup-Dokument),das ein Klartextdokument ist, zu welchem Erhöhungen hinzugefügt sind,und sendet das Erhöhungsdokumentzu der Ausgabeeinheit 3, wie nachfolgend im Einzelnen erläutert wird.Die Ausgabeeinheit 3 gibt das von der Erhöhungsverarbeitungseinheit 2 gesendeteErhöhungsdokumentaus.
[0025] DieErhöhungsverarbeitungseinheit 2 enthält eineKlartextdokument-Eingabeeinheit 10, eine Wörterbuch-Speichereinheit 11,eine Formelementen-Analysevorrichtung 12,eine Syntax-Analysevorrichtung 13, eine Datenspeichereinheit 14,eine Elementveredelungs-Verarbeitungseinheit 15, eine Erhöhungsdokument-Speichereinheit 16 undeine Erhöhungsdokument-Ausgabeeinheit 17.
[0026] DieKlartextdokument-Eingabeeinheit 10 empfängt das von der Eingabeeinheit 1 gesendeteKlartextdokument und sendet es zu der Formelementen-Analysevorrichtung 12.Die Wörterbuch-Speichereinheit 11 speichertein Wörterbuch,das füreine von der Formelementen-Analysevorrichtung 12 durchgeführte Formelementenanalyseverwendet wird, und ein Wörterbuch,das füreine von der Syntax-Analysevorrichtung 13 durchgeführte syntaktischeAnalyse verwendet wird.
[0027] DieFormelementen-Analysevorrichtung 12 führt eine Formelementenanalysebei dem von der Klartextdoku ment-Eingabeeinheit 10 empfangenenKlartextdokument durch, währendsie auf die in der Wörterbuch-Speichereinheit 11 gespeichertenWörterbücher Bezugnimmt, um das Klartextdokument in Kontrollinformationen zu zersetzen.Kontrollinformationen bestehen aus Zeichenketten, die jeweils eineminimale Bedeutungseinheit eines Dokuments bilden. Die Daten über dieKontrollinformationen, in die das Klartextdokument durch die Formelementen-Analysevorrichtung 12 zersetztist, werden zu der Syntax-Analysevorrichtung 13 gesendet.Da der Vorgang des Zersetzens des Klartextdokuments in Kontrollinformationen,der von der Formelementen-Analysevorrichtung 12 durchgeführt wird,bekannt ist, wird eine detaillierte Erläuterung des Zersetzungsvorgangsin dieser Beschreibung weggelassen.
[0028] DieSyntax-Analysevorrichtung 13 nimmt die Daten über dieKontrollinformationen, in die das Klartextdokument durch die Formelementen-Analysevorrichtung 12 zersetztwurde, an und führteine syntaktische Analyse zum Analysieren des Teils der Sprachevon jeder der Kontrollinformationen auf der Grundlage der Syntaxdes Dokuments durch, währendsie auf die in der Wörterbuch-Speichereinheit 11 gespeichertenWörterbücher Bezugnimmt, um die Dokumentenstruktur zeigende Daten zu erzeugen. Diesesstrukturierte Dokument enthältbedeutsame Wörterwie Positionselemente, Zeitelemente, Eigennamenelemente und Tätigkeitselemente.In dieser Beschreibung wird angenommen, dass bedeutsame Wörter Wörter undKopulas enthalten. Das von der Syntax-Analysevorrichtung 13 erzeugtestrukturierte Dokument wird dann zu der Elementveredelungs-Verarbeitungseinheit 15 gesendet.Da der Vorgang des Erzeugens des strukturierten Dokuments, der vonder Syntax-Analysevorrichtung 13 durchgeführt wird,be kannt ist, wird eine detaillierte Erläuterung des Erzeugungsvorgangsin dieser Beschreibung weggelassen.
[0029] DieDatenspeichereinheit 14 speichert als eine Datenbank verschiedeneDaten, die fürdie Erhöhungsverarbeitungverwendet werden. Die in der Datenspeichereinheit 14 gebildeteDatenbank wird zu jeder Zeit aktualisiert auf der Grundlage sowohlder von der Eingabeeinheit 1 eingegebenen Daten als auchder Daten über vonder Erhöhungsverarbeitungseinheit 2 erhalteneErgebnisse.
[0030] DieElementveredelungs-Verarbeitungseinheit 15 führt einenErhöhungsvorgangdes Addierens von Daten, die die Bedeutung oder den Inhalt jedesbedeutsamen Wortes zeigen, das in dem strukturierten Dokument enthaltenist, das von der Syntax-Analysevorrichtung 13 gesendetwurde, zu jedem bedeutsamen Wort durch, um ein strukturiertes Erhöhungsdokumentzu erzeugen. Das von der Elementveredelungs-Verarbeitungseinheit 15 erzeugteErhöhungsdokumentwird zu der Erhöhungsdokument-Speichereinheit 16 gesendet.
[0031] DieErhöhungsdokument-Speichereinheit 16 speichertdas von der Elementveredelungs-Verarbeitungseinheit 15 gesendeteErhöhungsdokument.Das in der Erhöhungsdokument-Speichereinheit 16 gespeicherteErhöhungsdokumentwird von der Erhöhungsdokumenten-Ausgabeeinheit 17 gelesen.Die Erhöhungsdokumenten-Ausgabeeinheit 17 liestdas in der Erhöhungsdokumenten-Speichereinheit 16 gespeicherteErhöhungsdokumentund sendet es zu der Ausgabeeinheit 3.
[0032] Nachfolgendwird, um das Prinzip der wie vorstehend beschrieben ausgebildetenDokumenteninformations-Verarbeitungsvorrichtungzu verstehen, eine Erläute runghinsichtlich eines Verfahrens des Erzeugens eines Erhöhungsdokumentsaus einem Klartextdokument gegeben, in dem ein Dokument über eineVorbesprechungsfreigabe, die füreine Produktankündigungverwendet wird, als ein Beispiel genommen wird. Das beispielhafteDokument der Vorbesprechungsfreigabe hat einen Teil, der durch Anführungszeichenwie folgt eingeschlossen ist: "00, Inc. hat angekündigt, dass sie mit der Markteinführung vonvier Modellen von DVD-Fahrzeugnavigationssystemenbeginnen will, enthaltend zwei erste Modelle von "A-Serien" der Fahrzeugnavigationsindustrie,die Java (eingetragene Marke)-Markenanmeldungenstützen,und zwei Modelle von "B-Serien", die einen erschwinglichenPreis haben, aber ein hohes Leistungsvermögen bieten, vom 20. April an."
[0033] Wenndieses Vorbesprechungsfreigabe-Dokument von der Eingabeeinheit 1 indie Erhöhungsverarbeitungseinheit 2 eingegebenwird, wird es weiterhin mittels der Klartextdokument-Eingabeeinheit 10 weiterzu der Formelementen-Analysevorrichtung 12 geliefert. DieFormelementen-Analysevorrichtung 12 führt eine Formelementenanalysebei dem Vorbesprechungsfreigabe-Dokument,das von Anführungszeicheneingeschlossen ist, durch, währendsie auf die in der Wörterbuch-Speichereinheit 11 gespeichertenWörterbücher Bezugnimmt, um das Vorbesprechungsfreigabe-Dokument in Kontrollinformationenzu zersetzen, und gibt Daten überdie Kontrollinformationen aus, in die das Vorbesprechungsfreigabe-Dokumentzersetzt ist, wie folgt:
[0034] DieDaten überdie Kontrollinformationen, in die das Vorbesprechungsfreigabe-Dokumentzerlegt ist, werden von der Formelementen-Analysevorrichtung 12 zuder Syntax-Analysevorrichtung 13 gesendet. Die Syntax-Analysevorrichtung 13 empfängt dieDaten von der Formelementen-Analysevorrichtung 12, führt eine syntaktischeAnalyse bei den Daten durch, währendsie auf die in der Wörterbuch-Speichereinheit 11 gespeichertenWörterbücher Bezugnimmt, und gibt ein strukturiertes Dokument aus, wie in der folgendenTabelle 1 gezeigt ist. [Tabelle1]
[0035] Dasvon der Syntax-Analysevorrichtung 13 erzeugte strukturierteDokument wird dann zu der Elementenveredelungs-Verarbeitungseinheit 15 gesendet.Die Elementenveredelungs-Verarbeitungseinheit 15 nimmt dasstrukturierte Dokument von der Syntax-Analysevorrichtung 13 an undführt einenVorgang des Hinzufügensvon Erhöhungenzu dem strukturierten Dokument durch, während sie auf die in der Datenspeichereinheit 14 gebildeteDatenbank Bezug nimmt, um ein Erhöhungsdokument zu erzeugen,in welchem eine Erhöhung zujedem bedeutsamen Wort hinzugefügtist, wie in der folgenden Tabelle 2 gezeigt ist. Das von der Elementveredelungs-Verarbeitungseinheit 15 erzeugteErhöhungsdokumentwird in der Erhöhungsdokument-Speichereinheit 16 gespeichert. [Tabelle2]
[0036] Somiterzeugt die Elementveredelungs-Verarbeitungseinheit 15 einErhöhungsdokument,bei dem der Erhöhungsvorganghinsichtlich der Bedeutung oder des Inhalts jedes bedeutsamen Wortes,das in dem strukturierten Dokument enthalten ist, durchgeführt wirddurch Hinzufügeneiner Erhöhungzu jedem bedeutsamen Wort. In dem Beispiel der obigen Tabelle 1und Tabelle 2 besteht die Erhöhungvon "00, Inc." darin, Attribute wie "Position", "Titel", "Offizier", "Organisation", "Adresse", "Kontaktadresse" zu "00, Inc." hinzuzufügen, und eineHinzufügungeiner erläuterndenAnmerkung zu jedem der Attribute oder eine Metadefinition für jedesder Attribute durchzuführen.Wenn das Ziel einer Erhöhungein anderes Objekt ist, kann jedes Element definiert werden alsein URI (gleichförmigerRessourcenidentifizierer) der Meta-Definition definiert werden.
[0037] Dievorstehend erwähnteEingabeeinheit 1 kann aus einer Textdokument-Eingabeeinheit 1a zumEingeben eines Klartextdokuments, das ein Text wie ein vorstehenderwähntesVorbesprechungsfreigabe-Manuskript ist, bestehend, wie in 2 gezeigt ist. Die Textdokument-Eingabeeinheit 1a kannaus einer von verschiedenen Vorrichtungen gebildet sein, die inder Lage sind, Klartextdokument zu erzeugen, wie eine Tastatur oderein externer Speicher. Die Ausgabeeinheit 3 kann aus einervon verschiedenen Vorrichtungen bestehen, die in der Lage sind,Dokumente visuell darzustellen, wie eine Anzeigeeinheit oder einDrucker. In diesem Fall kann die Ausgabeeinheit 3 eineexterne Kommunikationsausgabeeinheit 3a enthalten, diez.B. aus einer Kommunikationsausrüstung zum Übertragen des erzeugten Erhöhungsdokumentsnach außerhalbder Dokumenteninformations-Verarbeitungsvorrichtung besteht, wiein den 3 bis 5 gezeigt ist.
[0038] DieEingabeeinheit 1 kann eine externe Kommunikati onseingabeeinheit 1b enthaltenfür dieEingabe eines Klartextdokuments wie das vorstehend erwähnte Vorbesprechungsfreigabe-Manuskript,von einer externen Kommunikationsausrüstung, wie in 3 gezeigt ist. Die Ausgabeeinheit kanneine externe Kommunikationsausgabeeinheit 3a enthalten,die z.B. aus einer Kommunikationsausrüstung zum Übertragen des Erhöhungsdokumentsnach außerhalbder Dokumenteninformations-Verarbeitungsvorrichtungbesteht.
[0039] DieEingabeeinheit 1 kann z.B. eine externe Kommunikationseingabeeinheit 1c für die Eingabeeines Dokuments, bei dem ein Erhöhungsprozessdurchgeführtwird durch Verwendung von HTML (Hyper Text Markup Language), diezum Ausbilden von Homepages im Internet verwendet wird, und eineErhöhungsdokument-Analysevorrichtung 1d zumAnalysieren des Dokuments von der externen Kommunikationseingabeeinheit 1c,um Erhöhungenvon dem Eingabedokument zu entfernen und ein Klartextdokument zuerzeugen, enthalten, wie in 4 gezeigtist. Die Ausgabeeinheit 3 kann eine externe Kommunikationsaungabeeinheit 3a enthalten,die z.B. aus einer Kommunikationsausrüstung zum Übertragen des erzeugten Erhöhungsdokumentsnach außerhalbder Dokumenteninformations-Verarbeitungsvorrichtungbesteht.
[0040] Alseine Alternative kann die Eingabeeinheit 1 eine externeKommunikationseingabeeinheit 1e zur Eingabe eines strukturiertenDokuments wie einer E-Mail und eine E-Mailstruktur-Analysevorrichtung 1f zumAnalysieren der Struktur des von der externen Kommunikationseingabeeinheit 1e eingegebenenDokuments und zum Umwandeln des Dokuments in ein Klartextdokument,währendeine Beziehung zwischen einem Vorsatz und einem Körper desDokuments aufrecht erhalten wird, enthal ten, wie in 5 gezeigt ist. Die Ausgabeeinheit 3 kanneine externe Kommunikationsausgabeeinheit 3a enthalten,die z.B. aus einer Kommunikationsausrüstung zum Übertragen des erzeugten Erhöhungsdokumentsnach außerhalbder Dokumenteninformations-Verarbeitungsvorrichtungbesteht.
[0041] DerVorsatz einer E-Mail enthältDaten wie den Protokolltyp (X-STMP-Result), das Übertragungsdatum (Date), denAbsender (From), den Bestimmungsort (To, CC, BCC), den Titel (Subject),den Mailidentifizierer (Message-Id), den MIME-Typ (MIME-Version:1.0),den Typ der E-Mail-Software (X-Mailer), die Priorität (X-Priority), die Priorität (X-MSMil-Priority)der Nachricht, den Typ (Content-Type) des Körpers, und das Format (Content-Transfer-Encoding)des Körpers.
[0042] DerKörperist der Hauptteil der Nachricht und ist aus einem Klartextdokumentgebildet. Die E-Mail-Struktur-Analysevorrichtung 1f bestimmt,ob der Körperein Text mit Bezug auf den Typ (Content-Type) des Körpers, derin dem Vorsatz enthalten ist, ist oder nicht, und, wenn sie bestimmt,dass er ein Text ist, ihn so wie ein Klartextdokument ausgibt, wohingegen,wenn sie bestimmt, dass er nicht ein Text ist, in dem Dokument enthalteneErhöhungenlöscht,das Dokument in ein Klartextdokument umwandelt und das Klartextdokumentausgibt. Die E-Mail-Struktur-Analysevorrichtung 1f speichertInformationen wie das Übertragungsdatum (Date),den Absender (From), den Bestimmungsort (To, CC, BCC) und den Titel(Subject) in der in der Datenspeichereinheit 14 gebildetenDatenbank.
[0043] Eswird nun ein Fall angenommen, bei dem ein Freund (Taro Yamada) mir(Hanako Kawakami) am 25. Dezember 2002 um 20:00 Uhr eine Nachricht "Ich gehe morgen um19:00 Uhr zu Dir nach Hause" sendenwird. In diesem Fall ist Taro Yamadas E-Mail-Adresse als der Absenderin dem Vorsatz angezeigt, Hanako Kawakamis E-Mail-Adresse ist als derBestimmungsort in dem Vorsatz angezeigt, und 20:00 Uhr am 25. Dezember 2002ist als das Übertragungsdatumin dem Vorsatz angezeigt.
[0044] Wenndiese E-Mail überdie Klartextdokument-Eingabeeinheit 10 indie Formelementen-Analysevorrichtung 12 eingegebenenwird, nachdem sie von der in 5 gezeigtenexternen Kommunikationseingabeeinheit 1e empfangen wurde,und durch die E-Mail-Struktur-Analysevorrichtung 1f inein Klartextdokument geändertwurde, führtdie Formelementen-Analysevorrichtung 12 eineFormelementenanalyse bei dem Klartextdokument durch, während siesich auf die in der Wörterbuch-Speichereinheit 11 gespeichertenWörterbücher bezieht,und sie gibt Daten überKontrollinformationen aus, in die das Klartextdokument zerlegt ist,wobei die Daten durch Anführungszeichenwie folgt eingeschlossen sind: "/Ich/gehe/zu/Dir/nach Hause/um/morgen/19:00/"
[0045] DieDaten überKontrollinformationen, in die das Klartextdokument zerlegt ist,welche von der Formelementen-Analysevorrichtung 12 ausgegebenwerden, werden zu der Syntax-Analysevorrichtung 13 gesendet. DieSyntax-Analysevorrichtung 13 empfängt die Daten von der Formelementen-Analysevorrichtung 12,führt einesyntaktische Analyse bei den empfangenen Daten durch, während siesich auf die in der Wörterbuch-Speichereinheit 11 gespeichertenDaten bezieht, und gibt ein strukturiertes Dokument aus, wie inder folgenden Tabelle 3 gezeigt ist. [Tabelle3]
[0046] Dasvon der Syntax-Analysevorrichtung 13 erzeugte strukturierteDokument wird dann zu der Elementveredelungs-Verarbeitungseinheit 15 gesendet.Die Elementveredelungs-Verarbeitungseinheit 15 nimmt dasstrukturierte Dokument von der Syntax-Analysevorrichtung 13 an undführt einenVorgang des Hinzufügensvon Erhöhungenzu dem strukturierten Dokument so durch, dass ein Erhöhungsdokumenterzeugt wird, in welchem ein Erhöhungsvorgangbei jedem bedeutungsvollen Wort, das in dem strukturierten Dokumententhalten ist, durchgeführtwird, wie in der folgenden Tabelle 4 gezeigt ist, während aufdie in der Datenspeichereinheit 14 gespeicherten DatenBezug genommen wird. Das von der Elementveredelungs-Verarbeitungseinheit 15 erzeugteErhöhungsdokumentwird dann in der Erhöhungsdokument-Speichereinheit 16 gespeichert. [Tabelle4]
[0047] Somitführt dieDokumenteninformations-Verarbeitungsvorrichtungeinen Erhöhungsvorgangfür die Bedeutungoder den Inhalt jedes bedeutsamen Wortes, das in der Nachricht derE-Mail enthalten ist, durch. Bei dem vorstehend beschriebenen Beispielbesteht die Erhöhungjedes bedeutsamen Wortes in der Hinzufügung von Daten wie "Titel", "Adresse" und "Kontaktadresse" als Attribute desin der Nachricht spezifizierten Subjekts, und in dem Vorsehen einererläuterndenAnmerkung oder einer Meta-Definition für jedes der Datenwörter. Wenndas Ziel einer Erhöhungein anderes Objekt ist, kann jedes Element als URI einer Meta-Definition definiertwerden.
[0048] AlsNächsteswird die Elementveredelungs-Verarbeitungseinheit 15,die einen Teil der Erhöhungsverarbeitungseinheit 2 bildet,im Einzelnen erläutert.Die Elementveredelungs-Verarbeitungseinheit 15 enthält eineElementbeziehungs-Analysevorrichtung 20, eine Eigennamenelement-Verarbeitungseinheit 21,eine Zeitelement-Verarbeitungseinheit 22, eine Positionselement-Verarbeitungseinheit 23,eine Tätigkeitselement-Verarbeitungseinheit 24 undeine Datensammeleinheit 25, wie in 6 gezeigt ist.
[0049] EineSchätzeinheit 30 für die gegenwärtige Position,eine Zeitverarbeitungseinheit 31 und die Datenspeichereinheit 14 sindmit der Datensammeleinheit 25 verbunden. Die Datensammeleinheit 25 erwirbtDaten von der Schätzeinheit 30 für die gegenwärtige Position,der Zeitverarbeitungseinheit 31 und der Datenspeichereinheit 14 undliefert Daten fürProzesse, die von der Eigennamenelement-Verarbeitungseinheit 21,der Zeitelement-Verarbeitungseinheit 22, der Positionselement-Verarbeitungseinheit 23 undder Tätigkeitselement-Verarbeitungseinheit 24 durchzuführen sind.
[0050] DieSchätzeinheit 30 für die gegenwärtige Positionschätzteinen Dokumentenerzeuger und die gegenwärtige Position jedes Positionselements,das in dem Dokument erscheint, und sendet sie zu der Datensammeleinheit 25 derElementveredelungs-Verarbeitungseinheit 15. Die Zeitverarbeitungseinheit 31 berechnetein Datum entsprechend jedem Zeitelement (wird später beschrieben)auf der Grundlage des gegenwärtigenDatums und sendet das berechnete Datum zu der Datensammeleinheit 25 derElementveredelungs-Verarbeitungseinheit 15.
[0051] DieElementveredelungs-Verarbeitungseinheit 15 führt eineVerarbeitung bei jede der Wörterdurch, die in dem Dokument enthalten sind, das von der Syntax-Analysevorrichtung 13 einerSyntaxanalyse unterzogen und gesendet wurde, entsprechend einerin dem Fluss diagramm nach 7 gezeigtenProzedur. Mit anderen Worten, die Elementveredelungs-Verarbeitungseinheit 15 prüft, ob jedesder Wörter,das von der Syntax-Analysevorrichtung 13 einerSyntaxanalyse unterzogen und gesendet wurde, ein Substantivelementist oder nicht (im Schritt ST10). Wenn die Elementveredelungs-Verarbeitungseinheit 15 feststellt,dass das fragliche Wort ein Substantivelement ist, dann wird dieElementbeziehungs-Analysevorrichtung 20 gestartet und führt eineElementbeziehungs-Analyseverarbeitung durch (im Schritt ST11).
[0052] Wennsie andererseits in dem vorgenannten Schritt ST10 feststellt, dassdas fragliche Wort kein Substantivelement ist, prüft die Elementveredelungs-Verarbeitungseinheit 15 weiterhin,ob das fragliche Wort ein Verbelement ist oder nicht (im SchrittST12). Wenn die Elementveredelungs-Verarbeitungseinheit 15 feststellt, dassdas fragliche Wort ein Verbelement ist, dann wird die Elementbeziehungs-Analysevorrichtung 20 gestartetund führteine Elementbeziehungs-Analyseverarbeitung durch (im Schritt ST11).Wenn sie andererseits im Schritt ST12 feststellt, dass das fraglicheWort kein Verbelement ist, erkennt die Elementveredelungs-Verarbeitungseinheit 15,dass das fragliche Wort kein bedeutsames Element ist, beendet dieVerarbeitung des fraglichen Wortes und geht zu der Verarbeitungdes nächstenWortes weiter. Die Verarbeitung der Schritte ST10 bis ST12 wirdwiederholt, bis die Verarbeitung aller in dem von der Syntax-Analysevorrichtung 13 einerSyntaxanalyse unterzogenen und gesendeten Dokument enthaltenen Wörter beendetist.
[0053] Wenndie Elementveredelungs-Verarbeitungseinheit 15 bestimmt,dass jedes der in dem bereits analysierten Dokument enthaltene Wortein Substantiv- oder Verbelement ist, bestimmt die Elementbeziehungs-Analysevorrichtung 20 weiterhin,ob das fragliche Wort irgendeines von bedeutungsvollen Elementen enthaltendein Positionselement, ein Zeitelement, ein Eigennamenelement oderein Verbelement ist, und führt eineVerarbeitung des fraglichen Wortes durch, wobei die Verarbeitungdavon abhängt,ob das fragliche Wort irgendeines von bedeutungsvollen Elementenenthaltend ein Positionselement, ein Zeitelement, ein Eigennamenelementoder ein Verbelement ist.
[0054] Genauergesagt, die Elementbeziehungs-Analysevorrichtung 20 führt eineVerarbeitung gemäß der in demFlussdiagramm nach 8 gezeigtenProzedur durch. Mit anderen Worten, die Elementbeziehungs-Analysevorrichtung 20 prüft zuerst,ob jedes der in dem bereits analysierten Dokument enthaltenen Wörter ein Substantivelementist (im Schritt ST20). Wenn sie feststellt, dass jedes der Wörter einSubstantivelement ist, prüftdie Elementbeziehungs-Analysevorrichtung 20 weiterhin,ob das Substantivelement ein Positionselement ist oder nicht (imSchritt ST21). Ein Positionselement enthält eine Position des Dokumentenerzeugersund eine Position, die in dem Dokument erscheint. Wenn die Elementenbeziehungs-Analysevorrichtung 20 bestimmt, dasjedes der Wörterein Positionselement ist, ermöglichtdie Elementveredelungs-Verarbeitungseinheit 15 der Positionselementen-Verarbeitungseinheit 23,eine Positionselementenverarbeitung durchzuführen (im Schritt ST22). Danachkehrt der Ablauf zu der vorbeschriebenen Verarbeitung durch dieElementveredelungs-Verarbeitungseinheit 15 zurück.
[0055] Wennsie in dem vorbeschriebenen Schritt ST21 fest stellt, dass jedesder Wörternicht ein Verbelement ist, prüftdie Elementenbeziehungs-Analysevorrichtung 20 weiterhin,ob das Substantivelement ein Zeitelement ist oder nicht (im SchrittST23). Ein Zeitelement enthältdie Zeit der Herstellung des Dokuments und eine Position, die indem Dokument erscheint. Wenn die Elementenbeziehungs-Analysevorrichtung 20 feststellt,dass jedes der Wörterein Zeitelement ist, ermöglichtdie Elementenveredelungs-Verarbeitungseinheit 15 derZeitelementen-Verarbeitungseinheit 22,die Zeitelementenverarbeitung durchzuführen (im Schritt ST24). Danachkehrt der Ablauf zu der vorbeschriebenen Verarbeitung durch dieElementveredelungs-Verarbeitungseinheit 15 zurück.
[0056] Wennsie in dem vorbeschriebenen Schritt ST23 feststellt, dass jedesder Wörterkein Zeitelement ist, prüftdie Elementenbeziehungs-Analysevorrichtung 20 weiterhin,ob das Substantivelement ein Eigennamenelement ist oder nicht (imSchritt ST25). Ein Eigennamenelement enthält einen Eigennamen des Dokumentenherstellersund einen Eigennamen, der in dem Dokument erscheint. Wenn die Elementenbeziehungs-Analysevorrichtung 20 feststellt,dass jedes der Wörterein Eigennamenelement ist, ermöglichtdie Elementveredelungs-Verarbeitungseinheit 15 der Eigennamenelement-Verarbeitungseinheit 21,die Eigennamenelement-Verarbeitung durchzuführen (im Schritt ST26). Danachkehrt der Ablauf zu der vorbeschriebenen Verarbeitung durch dieElementveredelungs-Verarbeitungseinheit 15 zurück. Wennin dem vorbeschriebenen Schritt ST25 festgestellt wird, dass jedesder Wörterkein Eigennamenelement ist, führtdie Elementenbeziehungs-Analysevorrichtung 20 eine Rückkehr desAblaufs zu der Verarbeitung durch die Ele mentveredelungs-Verarbeitungseinheit 15 durch.
[0057] Wennin dem vorbeschriebenen Schritt ST20 festgestellt wird, dass jedesder in dem bereits analysierten Dokument enthaltenen Wörter keinSubstantivelement ist, prüftdie Elementenbeziehungs-Analysevorrichtung 20 weiterhin,ob jedes der Wörterein Verbelement ist oder nicht (im Schritt ST27). Wenn die Elementenbeziehungs-Analysevorrichtung 20 feststellt,dass jedes der Wörterein Verbelement ist, ermöglichtdie Elementveredelungs-Verarbeitungseinheit 15 derTätigkeitselementen-Verarbeitungseinheit 21,eine Tätigkeitselementverarbeitungdurchzuführen(im Schritt ST28). Danach kehrt der Ablauf zu der vorbeschriebenenVerarbeitung durch die Elementveredelungs-Verarbeitungseinheit 15 zurück. Wennsie in dem vorbeschriebenen Schritt ST27 feststellt, dass jedesder Wörterkein Verbelement ist, führtdie Elementenbeziehungs-Analysevorrichtung 20 eine Rückkehr desAblaufs zu der Verarbeitung durch die Elementveredelungs-Verarbeitungseinheit 15 durch.
[0058] DieEigennamenelementen-Verarbeitungseinheit 21 führt dieErhöhungsverarbeitungbei jedem Eigennamenelement durch. Genauer gesagt, führt dieEigennamenelementenverarbeitungseinheit 21 die Verarbeitunggemäß der indem Flussdiagramm nach 9 gezeigtenProzedur durch. Mit anderen Worten, die Eigennamenelement-Verarbeitungseinheit 21 sammeltzuerst Erhöhungselementendaten über Eigennamenelemente(im Schritt ST30). Genauer gesagt, sammelt die Eigennamenelement-Verarbeitungseinheit 21 Daten, diemit jedem Eigennamenelement assoziiert sind, aus der in der Datenspeichereinheit 14 gebildetenDatenbank überdie Datensammeleinheit 25.
[0059] DieEigennamenelementen-Verarbeitungseinheit 21 führt danneinen Erhöhungsvorgangbei jedem Eigennamenelement durch (im Schritt ST31). Mit anderenWorten, die Eigennamenelementen-Verarbeitungseinheit 21 assoziiertdie in dem vorbeschriebenen Schritt ST30 gesammelten Daten mit jedemEigennamenelement. Die Eigennamenelement-Verarbeitungseinheit 21 führt danneinen Erhöhungsvorgangvon assoziierenden internen Daten mit diesem Text durch (im SchrittST32). Genauer gesagt, die Eigennamenelementen-Verarbeitungseinheit 21 setztdie gesammelten Daten als eine Erhöhung in die Dokumentenstrukturein. Hierdurch werden, wie in Tabelle 2 gezeigt ist, als eine Erhöhung von "00, Inc.", "Position", "Titel", "Offizier", "Organisation", "Adresse", "Kontaktadresse" usw., die durcheine <besondererName>-Markierung umgeben sind,mit einer Markierung, die jedem dieser Elemente gegeben ist, eingefügt. Danachkehrt der Ablauf zu der vorbeschriebenen Verarbeitung durch dieElementenbeziehungs-Analysevorrichtung 20 zurück.
[0060] DiePositionselementen-Verarbeitungseinheit 23 führt einenErhöhungsvorgangbei jedem Positionselement durch. Genauer gesagt, die Positionselementen-Verarbeitungseinheit 23 führt dieErhöhungsverarbeitunggemäß der indem Flussdiagramm nach 10 gezeigtenProzedur durch. Mit anderen Worten, die Positionselementen-Verarbeitungseinheit 23 sammeltzuerst Erhöhungselementendaten über jedesPositionselement (im Schritt ST40). Genauer gesagt, erwirbt diePositionselementen-Verarbeitungseinheit 23 die gegenwärtige Positionentsprechend jedem Positionselement von der Schätzeinheit 30 für die gegenwärtige Position mittelsder Datensammeleinheit 25, und sie sammelt weiterhin Daten,die mit der von der in der Daten speichereinheit 14 gebildetenDatenbank erworbenen gegenwärtigenPosition assoziiert sind, mittels der Datensammeleinheit 25.
[0061] DiePositionselement-Verarbeitungseinheit 23 führt danneinen Erhöhungsvorgangbei jedem Positionselement durch (im Schritt ST41). Mit anderenWorten, die Positionselementen-Verarbeitungseinheit 23 assoziiertdie in dem vorbeschriebenen Schritt ST40 gesammelten Daten mit jedemPositionselement. Die Positionselementen-Verarbeitungseinheit 23 führt danneinen Erhöhungsvorgangbei den assoziierenden internen Daten mit diesem Text durch (imSchritt ST42). Genauer gesagt, fügtdie Positionselementen-Verarbeitungseinheit 23 diegesammelten Daten als eine Erhöhungin die Textdokumentenstruktur ein. Hierdurch werden, wie in Tabelle2 gezeigt ist, als eine Erhöhungvon "00, Inc.", "Längengrad", "Breitengrad" usw., die durchein <Positions>-Kennzeichen umgebensind, mit einer Markierung, die jedem von solchen Elementen gegebenist, eingefügt.Danach kehrt der Ablauf zu der vorbeschriebenen Verarbeitung durchdie Elementenbeziehungs-Analysevorrichtung 20 zurück.
[0062] DieZeitelementen-Verarbeitungseinheit 22 führt einen Erhöhungsvorgangbei jedem Zeitelement durch. Genauer gesagt, die Zeitelementen-Verarbeitungseinheit 22 führt dieVerarbeitung entsprechend der in dem Flussdiagramm nach 11 gezeigten Prozedur durch.Mit anderen Worten, die Zeitelementen-Verarbeitungseinheit 22 sammeltzuerst Erhöhungselementendaten über jedesZeitelement (im Schritt ST50). Genauer gesagt, die Zeitelementen-Verarbeitungseinheit 22 erwirbtein Datum entsprechend jedem Zeitelement von der Zeitverarbeitungseinheit 31 mittelsder Datensammeleinheit 25.
[0063] DieZeitelementen-Verarbeitungseinheit 22 führt dann einen Erhöhungsvorgangbei jedem Zeitelement durch (im Schritt ST51). Mit anderen Worten,die Zeitelementen-Verarbeitungseinheit 22 assoziiert diein dem vorbeschriebenen Schritt ST50 gesammelten Daten mit jedemZeitelement. Die Zeitelementen-Verarbeitungseinheit 22 führt danneinen Erhöhungsvorgangdes Assoziierens interner Daten mit diesem Text durch (im SchrittST52). Genauer gesagt, die Zeitelementen-Verarbeitungseinheit 22 fügt das erworbeneDatum als eine Erhöhungin die Textdokumentenstruktur ein. Hierdurch wird, wie in Tabelle2 gezeigt ist, als eine Erhöhungvon "morgen um 19:00Uhr" "2002-12-26T19:OOZ" oder dergleichen,welches durch eine <Zeit>-Markierung umgebenist, mit einer dem Element gegebenen Markierung eingefügt. Danachkehrt der Ablauf zu der vorbeschriebenen Verarbeitung durch dieElementenbeziehungs-Analysevorrichtung 20 zurück.
[0064] DieTätigkeitselementen-Verarbeitungseinheit 24 führt einenErhöhungsvorgangbei jedem Tätigkeitselementdurch. Genauer gesagt, führtdie Tätigkeitselementen-Verarbeitungseinheit 24 dieVerarbeitung entsprechend einer in dem Flussdiagramm nach 12 gezeigten Prozedur durch.Mit anderen Worten, die Tätigkeitselementen-Verarbeitungseinheit 24 sammeltzuerst Erhöhungselementendaten über jedesTätigkeitselement(im Schritt ST60). Genauer gesagt, die Tätigkeitselementen-Verarbeitungseinheit 24 sammeltDaten, die mit jedem Tätigkeitselementassoziiert sind, von der in der Datenspeichereinheit 14 gebildetenDatenbank mittels der Datensammeleinheit 25.
[0065] DieTätigkeitselementen-Verarbeitungseinheit 24 führt danneinen Erhöhungsvorgangbei jedem Tätigkeitselementdurch (im Schritt ST61). Mit anderen Worten, die Tätigkeitselementen-Verarbeitungseinheit 24 assoziiertdie in dem vorbeschriebenen Schritt ST60 gesammelten Daten mit jedemTätigkeitselement.Die Tätigkeitselementen-Verarbeitungseinheit 24 führt danneinen Erhöhungsvorgangvon assoziierenden internen Daten mit diesem Text durch (im SchrittST62). Genauer gesagt, die Tätigkeitselementen-Verarbeitungseinheit 24 fügt die gesammeltenDaten als eine Erhöhungin die Textdokumentenstruktur ein. Hierdurch wird, wie in Tabelle4 gezeigt ist, als eine Erhöhungvon "gehe" ein leeres Element,das durch eine <Tätigkeits>-Markierung umgeben ist, eingefügt. Danachgeht der Ablauf zu der vorbeschriebenen Verarbeitung durch die Elementenbeziehungs-Analysevorrichtung 20 zurück.
[0066] Wievorstehend erläutertist, kann die Dokumenteninformations-Verarbeitungsvorrichtung gemäß diesemAusführungsbeispiel1 einen von verschiedenen Typen von alphabetischen Informationenoder ein Dokument in Wörter(oder Kopulas) zerlegen und kann jedes dieser Wörter entsprechend seinem Teilvon Sprache klassifizieren. Dann kann die Dokumenteninformations-Verarbeitungsvorrichtunggemäß diesemAusführungsbeispiel1 automatisch die Bedeutung oder den Inhalt jedes bedeutungsvollenWortes, das in einem Zieldokument enthalten ist, hinzufügen durchVorsehen einer Erhöhungfür dieHinzufügungeiner Bedeutung oder eines Inhalts zu jedem klassifizierten Wortauf der Grundlage der Struktur des Zieldokuments und einer Datenbank,die in einem Informationsausrüstungs-Endgerät gespeichertist. Daher kann die Dokumenteninformations-Verarbeitungsvorrichtunggemäß diesemAusführungsbeispiel1 ein leicht verständlichesDokument übertragen,das einem Empfänger über seineBe deutung informieren kann und bei dem die Mehrdeutigkeit in der Bedeutungjedes Wortes oder jeder Kopula eliminiert ist. Als eine Folge können Benutzerihre Absichten Empfängerndurch Verwendung alphabetischer Informationen problemlos mitteilen.
[0067] DieBedeutung oder der Inhalt eines Wortes oder einer Kopula, bei dem/derein Erhöhungsvorgang durchgeführt ist,kann nicht nur einen Teil eines Dokuments, sondern auch eines Objektswie einer Sprache oder eines Bildes darstellen. Daher ermöglicht dieDokumenteninformations-Verarbeitungsvorrichtung gemäß diesemAusführungsbeispiel1 Benutzern, ihre Absichten Empfängernzu der Zeit des Austausches von einem von verschiedenen Typen vonalphabetischen Informationen oder eines Dokuments problemlos mitzuteilen.
[0068] Gemäß dem vorbeschriebenenAusführungsbeispiel1 befindet sich die Dokumenteninformations-Verarbeitungsvorrichtung in einer Informationsverarbeitungsvorrichtung,wie vorstehend erläutertist. Die Dokumenteninformations-Verarbeitungsvorrichtung kann jedochselbstverständlichdurch unabhängigeHardware implementiert werden.
权利要求:
Claims (13)
[1] Dokumenteninformations-Verarbeitungsvorrichtung,gekennzeichnet durch: eine Klartextdokument-Eingabeeinheit(10) zum Eingeben eines Klartextdokuments, eine Wörterbuch-Speichereinheit(11) zum Speichern eines für eine Formelementen-Analyseund eine syntaktische Analyse verwendeten Wörterbuchs, eine Formelementen-Analysevorrichtung(12) zum Durchführeneiner Formelementenanalyse bei dem von der Klartextdokument-Eingabeeinheiteingegebenen Klartextdokument unter Verwendung des in der Wörterbuch-Speichereinheitgespeicherten Wörterbuchs,um das Klartextdokument in Kontrollinformationen zu zerlegen, eineSyntax-Analysevorrichtung (13) zum Analysieren eines Teilsvon Sprache von jeder der von der Formelementen-Analysevorrichtungerhaltenen Kontrollinformationen auf der Grundlage einer Syntaxdes Klartextdokuments, um ein strukturiertes Dokument zu erzeugen,das bedeutungsvolle Wörterenthält, eineDatenspeichereinheit (14) zum Speichern von für einenErhöhungsvorgangverwendeten Daten, eine Elementenveredelungs-Verarbeitungseinheit(15) zum Durchführendes Erhöhungsvorgangsdes Lesens und Hinzufügensvon Daten, die mit jedem der bedeutungsvollen Wörter, die in dem von der Syntax-Analysevorrichtungerzeugten und in der Datenspeichereinheit gespeicherten strukturier tenDokument enthalten sind, zu jedem der bedeutungsvollen Wörter, umein Erhöhungsdokumentzu erzeugen, und eine Erhöhungsdokumenten-Ausgabeeinheit(17) zum Ausgeben des durch die Elementenveredelungs-Verarbeitungseinheitenerzeugten Erhöhungsdokuments.
[2] Dokumenteninformations-Verarbeitungsvorrichtung nachAnspruch 1, gekennzeichnet durch eine Textdokumenten-Eingabeeinheit(1a) zum Erzeugen eines Klartextdokuments und zum Sendenvon diesem zu der Klartextdokumenten-Eingabeeinheit.
[3] Dokumenteninformations-Verarbeitungsvorrichtung nachAnspruch 1, gekennzeichnet durch eine externe Kommunikationseingabeeinheit(1b) zum Eingeben eines Klartextdokuments von außerhalbder Vorrichtung durch Kommunikation und zum Senden von diesem zuder Klartextdokumenten-Eingabeeinheit.
[4] Dokumenteninformations-Verarbeitungsvorrichtung nachAnspruch 1, gekennzeichnet durch eine externe Kommunikationseingabeeinheit(1c) zum Eingeben eines Dokuments, bei dem ein Erhöhungsvorgangvon außerhalbder Vorrichtung durch Kommunikation durchgeführt wird, und eine Erhöhungsdokumenten-Analysevorrichtung(1d) zum Analysieren des Dokuments, bei dem der Erhöhungsdurchgangvon der externen Kommunikationseingabeeinheit durchgeführt ist,und zum Entfernen von Erhöhungenaus dem Dokument, um ein Klartextdokument zu erzeugen und es zuder Erhöhungsdokumenten-Eingabeeinheitzu senden.
[5] Dokumenteninformations-Verarbeitungsvorrichtung nachAnspruch 1, gekennzeichnet durch eine externe Kommunikationseingabeeinheit(1e) zum Eingeben einer E-Mail von außerhalb der Vorrichtung durchKommunikation und eine E-Mail-Struktur-Analysevorrichtung (1f) zumAnalysieren einer Struktur der E-Mail von der externen Kommunikationseingabeeinheit,um ein Klartextdokument zu erzeugen, und zum Senden des Klartextdokumentszu einer Erhöhungsdokumenten-Eingabeeinheit.
[6] Dokumenteninformations-Verarbeitungsvorrichtung nacheinem der Ansprüche2 bis 5, gekennzeichnet durch eine externe Kommunikationsausgabeeinheit(3a) zum Senden des Erhöhungsdokumentsvon der Erhöhungsdokumenten-Ausgabeeinheitnach außerhalb.
[7] Dokumenteninformations-Verarbeitungsvorrichtung nachAnspruch 1, dadurch gekennzeichnet, dass die Elementenveredelungs-Verarbeitungseinheiteine Elementenbeziehungs-Analysevorrichtung (20) enthält zum Assoziiereneines bedeutungsvollen Elements mit jedem der in den von der Syntax-Analysevorrichtung erzeugtenstrukturierten Dokument enthaltenen bedeutungsvollen Wörter, wobeidas bedeutungsvolle Element eine Bedeutung jedes der bedeutungsvollenWörteranzeigt.
[8] Dokumenteninformations-Verarbeitungsvorrichtung nachAnspruch 7, gekennzeichnet durch eine Eigennamenelementen-Verarbeitungseinheit(21) zum Hinzufügeneiner Erhöhungzu einem Eigennamenelement, das einen Eigennamen anzeigt, wobeidie Elementenbeziehungs-Analysevorrichtung die Eigennamenelementen-Verarbeitungseinheitstartet, wenn das bedeutungsvolle Element ein Eigennamenelementist.
[9] Dokumenteninformations-Verarbeitungsvorrichtung nachAnspruch 7, gekennzeichnet durch eine Zeitelementen-Verarbeitungseinheit(22) zum Hinzufügeneiner Erhöhungzu einem eine Zeit anzeigenden Zeitelement, wobei die Elementenbeziehungs-Analysevorrichtungdie Zeitelementen-Verarbeitungseinheitstartet, wenn das bedeutungsvolle Element ein Zeitelement ist.
[10] Dokumenteninformations-Verarbeitungsvorrichtungnach Anspruch 9, gekennzeichnet durch eine Zeitverarbeitungseinheit(31) zum Berechnen eines Datums entsprechend dem Zeitelement,wobei die Zeitelementen-Verarbeitungseinheit das Datum von der Zeitverarbeitungseinheitals eine Erhöhungzu dem Zeitelement hinzufügt.
[11] Dokumenteninformations-Verarbeitungsvorrichtungnach Anspruch 7, gekennzeichnet durch eine Positionselementen-Verarbeitungseinheit(23) zum Hinzufügeneiner Erhöhungzu einem eine Position anzeigenden Positionselement, wobei die Elementenbeziehungs-Analysevorrichtungdie Positionselementen-Verarbeitungseinheit startet, wenn das bedeutungsvolleElement ein Positionselement ist.
[12] Dokumenteninformations-Verarbeitungsvorrichtungnach Anspruch 11, gekennzeichnet durch eine Schätzeinheit (30) für die gegenwärtige Positionzum Schätzeneiner gegenwärtigenPosition entsprechend dem Positionselement, wobei die Positionselementen-Verarbeitungseinheitdie gegenwärtigePosition von der Schätzeinheitfür die gegenwärtige Positionals eine Erhöhungzu dem Positionselement hinzufügt.
[13] Dokumenteninformations-Verarbeitungsvorrichtungnach Anspruch 7, gekennzeichnet durch eine Tätigkeitselementen-Verarbeitungseinheit(24) zum Hinzufügeneiner Erhöhungzu einem eine Tätigkeitanzeigenden Tätigkeitselement,wobei die Elementenbeziehungs-Analysevorrichtung die Tätigkeitselementen-Verarbeitungseinheitstartet, wenn das bedeutungsvolle Element ein Tätigkeitselement ist.
类似技术:
公开号 | 公开日 | 专利标题
US10296568B1|2019-05-21|Systems and methods for enhancing electronic communications
US20190079983A1|2019-03-14|Techniques for creating computer generated notes
CA2840485C|2019-10-01|Summarization of conversation threads
Estival et al.2007|Author profiling for English emails
Şeker et al.2012|Initial explorations on using CRFs for Turkish named entity recognition
Crystal2011|Internet linguistics: A student guide
Nagao et al.2001|Semantic annotation and transcoding: Making web content more accessible
EP0914637B1|2001-10-17|System zum unterstützen der produktion von dokumenten
Resnick2001|Internet message format
US8423347B2|2013-04-16|Natural language personal information management
KR101099278B1|2011-12-26|명명된 엔티티 목록 생성기, 명명된 엔티티 모델 생성 방법 및 컴퓨터 판독가능 기록 매체
KR101881114B1|2018-07-24|메시지들에서 태스크들 식별
RU2245577C2|2005-01-27|Электронная доска объявлений и почтовый сервер
US7181683B2|2007-02-20|Method of summarizing markup-type documents automatically
Corston-Oliver et al.2004|Task-focused summarization of email
US6658377B1|2003-12-02|Method and system for text analysis based on the tagging, processing, and/or reformatting of the input text
AU2003262290B2|2009-09-17|Method and computer-readable medium for importing and exporting hierarchically structured data
US9619464B2|2017-04-11|Networked language translation system and method
US7143026B2|2006-11-28|Generating rules to convert HTML tables to prose
US8463598B2|2013-06-11|Word detection
US8050906B1|2011-11-01|Systems and methods for translating text
US8495049B2|2013-07-23|System and method for extracting content for submission to a search engine
US7398203B2|2008-07-08|Linguistically intelligent text compression
US7233891B2|2007-06-19|Natural language sentence parser
US5541838A|1996-07-30|Translation machine having capability of registering idioms
同族专利:
公开号 | 公开日
CN1604076A|2005-04-06|
JP2004310691A|2004-11-04|
US20040205670A1|2004-10-14|
US7269789B2|2007-09-11|
CN1604076B|2010-05-05|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题
法律状态:
2004-12-23| OP8| Request for examination as to paragraph 44 patent law|
2011-02-17| 8139| Disposal/non-payment of the annual fee|
优先权:
申请号 | 申请日 | 专利标题
[返回顶部]